2.2 基于CRE重复抽样的Neyman推断

1 有限总体的统计量

考虑一个 CRE, 包含 n 个实验单元; n1 个接受实验, n0 个作为对照. 定义潜在输出 Yi(1),Yi(0) 和个体的 因果效应 τi=Yi(1)Yi(0). 则潜在输出有有限的总体均值 Y(1)=1ni=1nYi(1),Y(0)=1ni=1nYi(0), 以及总体方差[1] S2(1)=1n1i=1n{Yi(1)Y(1)}2,S2(0)=1n1i=1n{Yi(0)Y(0)}2,
还有协方差 S(1,0)=1n1i=1n{Yi(1)Y(1)}{Yi(0)Y(0)}.
因果效应有均值 τ=1ni=1nτi=Y(1)Y(0) 和方差 S2(τ)=1n1i=1n(τiτ)2.

引理

2S(1,0)=S2(1)+S2(0)S2(τ).

2 Neyman 定理

回忆上一篇笔记, 我们定义样本均值 Y^(1)=1n1i=1nZiYi,Y^(0)=1n0i=1n(1Zi)Yi 和样本方差 S^2(1)=1n11i=1nZi{YiY^(1)}2,S^2(0)=1n01i=1n(1Zi){YiY^(0)}2.
但是 S(1,0), S2(τ) 没有样本版本, 因为同一个 i 我们没法同时观测到 Yi(1)Yi(0).

下面的定理给出了我们的因果效应的均值 τ^ 的性质.

定理 (Neyman)

在 CRE 下

  1. τ^=Y^(1)Y^(0) 关于 τ 无偏, 也即 E(τ^)=τ.
  2. τ^ 有方差 (2.1)Var(τ^)=S2(1)n1+S2(0)n0S2(τ)n(2.2)=n0n1nS2(1)+n1n0nS2(0)+2nS(1,0).
  3. 方差估计量 V^=S^2(1)n1+S^2(0)n0 关于 Var(τ^) 保号, 也即 E(V^)Var(τ^)=S2(τ)n0, 等号成立当且仅当 τi=τ, i.

在这里只有 Zi 是随机的, 而 Yi(1),Yi(0) 都是固定的, 因此随机化只是从 n 中选出 n1 个元素, 这总共有 M=(nn1) 种可能.

回顾 FRT, 我们来对比两者的不同点

Pasted image 20251005214912.png

我们下面来观察一下 (2.1). S2(τ) 的系数为负, 这说明当 τ 的方差越大, τ^ 的方差反而越小. 我们基于 (2.2) 给出一个直观的解释. 分别考虑 S(1,0)>0S(1,0)<0. 我们假设观测到相对较大的实验组的潜在输出.

总的来说, 尽管 τ^ 的无偏性不依赖于 S(1,0), 我们依然在 S(1,0)>0 时更有可能观测到更极端的 τ^.

关于 τ^ 我们有进一步的渐近性质.

定理 (证明略)

n,n1. 如果 n1n 的极限在 (0,1) 上, 且 {S2(1),S2(0),S(1,0)} 有极限, 且 max1in{Yi(1)Y(1)}2n0,max1in{Yi(0)Y(0)}2n0, 则 τ^τVar(τ^)dN(0,1),S^2(1)pS2(1),S^2(0)pS2(0).

3 CRE 的回归分析

实际中我们会用基于回归的推断方法来得到 τ. 我们可以运行 OLS: (α^,β^)=argmin(a,b)i=1n(YiabZi)2, 然后把 β^ 作为 τ. 我们可以证明 β^=τ^.
但是, 它的方差 V^OLS=n(n11)(n2)n1n0S^2(1)+n(n01)(n2)n1n0S^2(0)S^2(1)n0+S^2(0)n1, 即使用了近似也与 V^ 不同. 不过, EHW 的方差值相近: V^EHW=n11n12S^2(1)+n01n02S^2(0)S^2(1)n1+S^2(0)n0.


  1. 这里我们分母没有用 n 是为了让定理看起来形式优雅, 没有本质区别. ↩︎